characterai

Character AI推出革命性音视频生成模型OVI

研究团队面临的最大挑战是如何让机器理解视觉和听觉之间的微妙关系。比如,当屏幕上的人张嘴说话时,声音应该恰好从那张嘴里传出来;当画面中出现鼓槌敲击的动作时,鼓声应该精确地与动作同步。传统的方法是分别训练两个专门的"专家"——一个负责视觉,一个负责听觉,然后想办法

模型 音频 音视频 ovi characterai 2025-10-28 16:19  1